Koostemerkki

Koostemerkki tarkoittaa erityisesti Unicode-termistössä kirjoitusmerkkiä, joka voidaan määritellä kahden tai useamman merkin yhdistelmäksi, vaikka teknisesti se on itsenäinen kokonaisuus, jolla on oma Unicode-tunnus. Tyypillisesti koostemerkki on tarkkeella varustettu kirjain, kuten š (U+0161 eli latinalainen pienaakkonen s ja hattu), joka voidaan muodollisesti hajottaa kantamerkiksi s (U+0073) ja yhdistyväksi hatuksi (U+030C). Tällainen niin sanottu hajotelma on ymmärrettävä yhtäläiseksi vastaavan koostemerkin kanssa.[1][2]

Vanhastaan tietokoneet ovat käsitelleet tarkkeellisia kirjaimia nimenomaan koostemerkkeinä. Vaikka Unicode on mahdollistanut myös hajotelmien käytön ja periaatteessa suosiikin niitä, jotkin ohjelmat voivat pyrkiä korvaamaan hajotelmat koostemerkeillä, joiden käsittely on teknisesti yksinkertaisempaa. Kaikki yhdistelmät eivät kuitenkaan ole saatavilla koostemerkkeinä.

Toisaalta kantamerkin erottaminen koostemerkistä helpottaa esimerkiksi tietokoneavusteista tiedonhakua, kun vaikkapa turkkilaista nimeä Erdoğan voi hakea pelkistetysti muodossa ”Erdogan” tarvitsematta miettiä, miten saisi suomalaisella näppäimistöllä g-kirjaimeen lisätyksi lyhyysmerkin.[3] Vastaavasti aakkostus tapahtuu usein ensisijaisesti kantamerkin perusteella,[4] joskin tällöin on otettava huomioon kielikohtaiset erot. Esimerkiksi suomen aakkosiin kuuluvat koostemerkit å, ä ja ö itsenäisinä kirjaimina, mutta englantilaisittain ne tulkitaan vain tarkkeellisiksi muunnelmiksi, jotka aakkostuvat samalla tavalla kuin kantamerkki a tai o. Koostemerkki š puolestaan aakkostuu suomalaisittainkin samalla tavalla kuin kantamerkki s, mutta virolaisittain erikseen tarkkeettoman s:n jälkeen.

  1. Viittausvirhe: Virheellinen <ref>-elementti;viitettä Korpela 2011 ei löytynyt
  2. Viittausvirhe: Virheellinen <ref>-elementti;viitettä Unicode 2009 ei löytynyt
  3. Viittausvirhe: Virheellinen <ref>-elementti;viitettä Weiss 2001 ei löytynyt
  4. Viittausvirhe: Virheellinen <ref>-elementti;viitettä Microsoft 2010 ei löytynyt

Developed by StudentB